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摘要 : 黄 曲 条 跳 甲 Phyllotreta striolata (Fabricius) 是 十 字 花 科 蔬 莱 的 重要 害虫 。 为 深入 了 解 其 和 遗传 信息 , 本 研究 应 
用 新 一 代 高 通 量 测序 技术 lumina’ s Solexa 平台 对 黄 曲 条 跳 甲 成 虫 的 转录 组 进行 测序 , 并 结合 SOAPdenovo DEBES 
类 等 分 析 软 件 , 获取 大 量 的 EST 和 挖掘 功能 基因 。 本 文 最 终 获 得 了 4 924 条 序列 重 麦 群 (contig) , 其 中 包含 2 209 
种 与 黑 腹 果 蝇 Drosophila melanogaster 蛋白 基因 具 直 系 同 源 的 独立 基因 (unigene) 和 610 种 黄 曲 条 跳 甲 物种 特有 的 
unigene。 结 合 Gene Ontology ( GO) 数据 库 进 行 分 析 , 发 现 大 部 分 的 unigene 具 结合 能 力 (binding capability ) 和 催化 
活性 (catalytic activity); 上 百 种 unigene 可 聚 类 于 生物 学 过 程 分 类 中 的 配子 发 生 、 生 和 殖 腺 发 育 和 交配 行为 等 重要 功 
能 。 另 外 , 结合 KEGG Pathway 数据 库 分 析 发 现 , 共有 363 种 unigene 参与 或 涉及 了 40 种 代谢 路 径 , 其 中 生物 钟 调 
控 路 径 和 植物 次 生 代 谢 物 路 径 等 相关 基因 的 发 现 , 有 助 于 深入 研究 黄 曲 条 跳 甲 行为 发 生 的 内 在 机 理 。Solexa 高 通 
量 测序 技术 作为 昆虫 功能 基因 组 研究 的 重要 手段 , 为 发 掘 黄 曲 条 跳 甲 功能 基因 发 挥 了 重要 作用 , 也 为 在 分 子 水 平 
上 研发 黄 曲 条 跳 甲 的 防治 新 策略 提供 了 更 翔实 的 基因 信息 。 
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Transcriptome characteristics of Phyllotreta striolata ( Fabricius ) 
( Coleoptera: Chrysomelidae ) analyzed by using Ilumina’ s Solexa 


sequencing technology 

HE Hua-Liang', BIN Shu-Ying*, WU Zhong-Zhen, LIN Jin-Tian * ( Institute for Management of Invasive 
Alien Species, Zhongkai University of Agriculture and Engineering, Guangzhou 510225, China) 
Abstract: The striped flea beetle, Phyllotreta striolata ( Fabricius) , is an important pest damaging 
cruciferous vegetables. In order to investigate the profile of gene expression and elucidate the functional 
genes, we sequenced the transcriptome of the adult of P. striolata by Illumina’ s Solexa sequencing 
technology, and analyzed the data of expressed sequence tags ( ESTs) by using SOAPdenovo system. A 
total of 4 924 contigs were obtained including 2 209 unigenes of orthologous genes relating to Drosophila 
melanogaster and 610 species-specific unigenes of P. striolata based on Gene Ontology and KEGG 
databases. We found that most of unigenes contain function domains with binding capacity and catalytic 
activity. More than 100 unigenes are involved in gamete generation, ovarian follicle cell development and 
mating behavior. Three hundred sixty-three unigenes may be involved in 40 different metabolic pathways 
based on KEGG database. The finding that 363 unigenes are involved in regulation pathway of biological 
rhythm and plant secondary metabolites will be useful to clarify the mechanism of behaviors of this insect 
such as oviposition rhythm, etc. Moreover, the sequence resources presented in this study provide useful 
information to develop new strategies to manage this pest. 
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黄 曲 条 跳 甲 Phyllotreta striolata ( Fabricius) f& PESE. ri ( Tahvaanainen, 1983) ,广泛 分 布 于 我 国 南 
称 独 乱 虫 、 沫 重子 、 土 跳 重 、 黄 跳 重 等 ,隶属 萌 翅 KEK, FANEK A34. 2 Bh. ÉL. BEA. 
目 叶 甲 科 昆虫 。 黄 曲 条 跳 甲 是 十 字 花 科 蔬 全 的 世界 MKE RRES, 2000). 。 国 内 外 对 黄 曲 条 跳 甲 在 
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形态 学 、 生 态 学 及 抗 药 性 监测 方面 已 有 了 广泛 的 人 研 
25 SKJRGULMIZE) X, 2000; Feng et al., 2000; £8 
HS, 2003; 周 先 治 和 吴刚 ，2004; M SES SE, 
2006) 。 但 是 长 期 以 来 倚重 化 学 防治 的 策略 使 得 黄 
曲 条 跳 甲 对 很 多 化 学 药剂 都 出 现 了 不 同 程度 的 抗 药 
性 , 而 抗 药 性 的 动态 发 展 又 使 得 对 其 危害 的 控制 越 
来 越 困 难 。 目 前 , 广东 省 部 分 地 区 黄 曲 条 跳 甲 的 危 
害 甚至 已 超过 小 沫 蛾 的 危害 。 黄 曲 条 跳 甲 产生 狙 狐 
和 危害 的 另 一 个 重要 原因 是 因 其 幼虫 是 在 土 颖 中 孵化 
并 危害 寄主 植物 的 根系 (爱河 兴 ，2007; ERF, 
2009) ,而 常规 化 学 防治 法 对 幼虫 却 著 长 英 及 。 
Jt, 目前 需要 积极 探讨 控制 黄 曲 条 跳 甲 的 防治 新 策 
WE. Zhao 等 (2011 ) 首次 成 功 鉴 定 了 黄 曲 条 跳 甲 精 
氨 酸 激酶 PsAK 和 特异 性 气味 受 体 PsOrl 基因 的 
cDNA 序列 , 并 通过 RNA 干涉 技术 抑制 了 靶 标 基因 
的 表达 , 结果 表明 上 述 两 个 基因 功能 的 受 损 可 导致 
黄 曲 条 跳 甲 死亡 、 产 卵 选 择 性 和 取 食 选择 性 发 生 改 
变 等 现象 ,为 在 分 子 水平 探 讨 基 于 黄 曲 条 跳 甲 行为 
调控 的 防治 新 策略 提供 了 新 的 参考 。 

截至 目前 , 在 GenBank 上 注册 的 黄 曲 条 跳 甲 的 
cDNA 或 EST 序列 仅仅 只 有 5 种 , 分 别 是 上 文 提 到 
的 PsAK 和 PsOrl , 以 及 抗 药 性 发 生 相关 的 2 个 非 专 
一 性 酯 酶 基因 和 1 个 乙酰 胆 碱 酯 酶 基因 的 EST 序 
列 。 黄 曲 条 跳 甲 已 发 展 成 为 当前 蔬 莱 产业 的 重要 害 
E, 而 其 基因 组 及 转录 组 研究 的 淖 后 使 得 对 黄 曲 条 
跳 甲 的 深入 研究 具有 一 定 的 困难 。 基 因 表 达 序 列 标 
4& (expressed sequence tags, EST) 技术 被 认为 是 一 
种 人 研究 转录 组 的 有 效 方 法 , 广泛 应 用 于 新 基因 发 
现 、 基 因 表 达 分 析 和 入 日 质 组 学 (Ewing et al., 
1999) , 新 一 代 高 通 量 测序 技术 Humina’ s Solexa 是 
对 传统 测序 方法 的 一 次 革命 性 变革 ( Nagalakshmi et 
al., 2008; Rosenkranz et al., 2008) 。Solexa 测序 性 
价 比 最 高 ,运行 成 本 较 低 ,高 通 量 , 高 精确 性 ， 可 
以 同时 检测 上 亿 个 核 音 酸 片 断 。 虽 然 该 技术 的 序 
列 读 取 长 度 较 短 , 但 其 序列 的 拼接 过 程 最 终 能 达到 
高 精准 度 。 模 式 昆 虫 埃 及 伊 蚊 Aedes aegypti 和 网 比 
Vr diy Anopheles gambiae 的 EST 大 规模 测序 中 , 采 
用 的 就 是 Solexa' s Illumina 技术 ( Gibbons et al., 
2009), igir, 一 种 非 模 式 生 物 蜗 牛 Radix balthica 
也 采用 该 技术 完成 了 转录 组 的 测序 任务 ( Feldmeyer 
et al.,，2011) 。 高 通 量 转录 组 测序 可 在 短 时 间 内 获 
得 的 大 量 的 unigene 信息 。 目 前 , 国际 上 已 构建 了 
unigene 的 数据 库 ， 即 UniGene, UniGene 是 从 属于 
GenBank 的 一 部 分 , 专门 收集 非 元 余 性 的 基因 来 源 


的 clusters 数据 。 每 一 个 UniGene cluster 包含 代表 
单一 基因 的 序列 和 相关 的 信息 ， 可 为 科学 研究 快速 
提供 有 用 信息 , 例如 基因 表达 的 组 织 类 型 和 图 谱 定 
位 信息 (Schuler, 1997; Pontius et al., 2003), 
此 , 应 用 Solexa 高 通 量 测 序 技术 对 农业 害虫 进行 
录 组 研究 , 可 大 大 降低 测序 所 需 时 间 和 成 本 , 使 我 
们 能 够 对 部 分 重要 的 非 模式 生物 或 农业 害虫 局 动 高 
通 量 水 平 的 基础 赋 究 及 后 组 的 应 用 研究 。 

本 实验 将 Solexa 高 通 量 测序 技术 应 用 到 黄 曲 条 
跳 甲 的 转录 组 学 研究 中 , 并 应 用 生物 信息 学 方法 对 
所 得 序列 与 模式 昆虫 黑 腹 果 蜗 Drosophila 
melanogaster 和 赤 拟 谷 盗 Tribolium castaneum 等 的 基 
因 组 及 转录 组 序列 进行 比 对 分 析 ， 从 功能 基因 组 水 
平 上 鉴定 一 批 黄 曲 条 跳 甲 的 重要 基因 。 本 研究 主要 
检测 与 黄 曲 条 跳 甲 生殖 发 育 和 生殖 行为 等 相关 的 关 
键 基因 ; 参与 寄主 蔬 沫 次 生 代 谢 或 挥发 性 化 合 物 分 
子 代谢 的 基因 ; 以 及 生物 钟 代 谢 路 径 相 关 的 核心 生 
物 钟 基因 、 调 控 因 子 等 。 上 述 关键 基因 的 鉴定 将 为 
在 分 子 水 平 开 展 黄 曲 条 跳 甲 行为 调控 及 防治 新 策略 
的 研究 葛 定 前 期 数据 基础 。 


1 材料 与 方法 


1.1 供 试 昆虫 

黄 曲 条 跳 甲 P. striolata (Fabricius) 成 虫 来 源 
于 广州 市 市 郊 黄埔 古 港 蔬 沫 基地 , 采集 位 置 为 从 荣 
Brassica juncea 的 心 叶 部 位 ,采集 时 间 为 2010 年 6 
月 11 日 的 11: 00-15: 00。 虫 源 采 集 点 即时 温度 
为 27%C ,相对 湿度 为 75% ,光照 度 为 4 290 Ix, 收 
集成 虫 后 立即 用 液 毛 冷冻 , FT -80 人 备用。 
1.2 RNA 提取 和 cDNA 文库 构建 

采用 总 RNA 提取 试剂 盒 ( Qiagen) 提取 黄 曲 条 
BEFB x, rd RNA。 以 2 pg 总 RNA 为 模板 ,cDNA 
PCR Library Kit ( TaKaRa) 反 转 录 合 成 双 链 cDNA, 
并 PCR 扩 增 , 扩 增 条 件 为 : 94% 1 min; 94C 30 s, 
60C 30 s, 72C 3 min， 进 行 10 个 循环 。 采 用 
PureLinkTM PCR Purification Kit ( Invitrogen) 去 除 体 
系 中 小 于 300 bp 的 片段 。 通 过 多 次 的 PCR 2 38. 
纯化 、 浓缩 , 最 终 共 收集 到 双 链 cDNA 10 ug, 浓度 
超过 1 hg/hL, 送 往 华 大 基因 公司 Solexa 高 通 量 测 
序 平台 。 
1.3 Solexa 文库 构建 和 测序 

应 用 新 一 代 高 通 量 测序 平台 Illumina’ s Solexa 
Genome Analyzer I Xf cDNA 样品 测序 。S ug 双 链 
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cDNA 打上 断 为 130 bp Zr à Br Bon. PE S REDE 
性 衔接 子 A MB, 变性 为 单 链 连接 到 磁 珠 上 ， 经 
emPCR 富 集 后 ， 置 于 PicoTiterPlate 板 上 ， 上 机 测 
序 。 两 端 测序 , 每 一 个 序列 读 取 片 段 (read) 的 读 长 
约 90 bp。 
1.4 序列 拼接 、 功 能 注释 及 分 类 

采用 GS-FLX Software 去 除 衔接 子 区 域 和 低 质 
量 序 列 ， 屏 项 cDNA 文库 PCR 引物 ， 采用 
SOAPdenovo 软件 对 每 一 个 序列 读 取 搬 段 聚 类 进行 
拼接 (Li et al., 2010)，, 形成 序列 不 间断 的 contig/ 
unigene。 后 续 采 用 序列 比 对 的 方法 对 所 得 序列 注 
TE, 使 用 Blastn 与 NCBI 的 非 元 余 核 酸 序列 数据 库 
( non-redundant nucleotide database, nt) 进行 比较 (FE 
值 为 le-10) ,进一步 使 用 blastx 与 NCBI 的 非 元 余 
蛋白 序列 数据 库 (non-redundant protein database, 
nr) 和 黑 腹 果 蝇 的 蛋白 组 数据 库 进行 比较 (EF 值 为 
1e-5) ,所 有 分 析 使 用 默认 参数 。unigene 的 功能 域 
注释 及 分 类 分 析 主 要 结合 Gene Ontology (GO) 数 
据 库 (http://amigo. geneontology. org/cgi-bin/amigo/ 
blast. cgi? session _ id = 9036amigo1316253192 )、 
SMART 数据 库 (http://smart. embl-heidelberg. de/) 
和 KEGG 数据 库 ( http://www. genome. jp/kegg/ 
pathway. html), Gene Ontology (GO) 分 类 分 析 又 可 
进一步 按 生 物 学 过 程 (biological process) 、 分 子 功能 
function ) 和 细胞 组 分 ( cellular 
component) 三 大 亚 类 进行 分 类 。 对 所 有 注释 信息 整 
H, 重点 搜索 与 黄 曲 条 跳 甲 的 生殖 发 育 及 生殖 行 》> 
相关 的 关键 基因 及 可 能 参与 的 调控 因子 等 。 
1.5 系统 发 育 分 析 

从 NCBI 上 下 载 昆 虫 纲 中 部 分 代表 性 昆虫 
innexin2 的 全 长 cDNA 序列 , 使 用 ClustalX 1.8 软件 
对 这 些 序列 进行 比 对 , 输出 后 缀 为 * . phy 格式 的 文 
件 。 采 用 分 子 进 化 遗传 分 析 软 件 PHYLIP3. 68 进行 
遗传 距离 分 析 , 具体 步骤 如 下 : 把 * . phy 文件 拷贝 
到 PHYLIP 目录 下 , 更 名 为 infile; 用 Seqboot 分 析 ， 
复制 数 为 1 000, 运行 后 生成 1 000 套 比 对 序列 的 文 
件 , 将 此 文件 更 名 为 infile; 运行 最 大 简约 法 程序 
DNAPARS, 生成 两 个 文件 outfile 和 treefile; 利用 多 
重 树 构建 一 致 桂 ,， 即 打开 CONSENSE 软件 , 将 刚才 
生成 的 treefile 文件 更 名 后 输入 , 生成 两 个 文件 
outfile 和 treefile， 完 成 进化 树 的 生成 。 其 中 treefile 
Hj TREEVIEW 打开 ,， 即 可 浏览 一 致 桂 。 遗 传 距 离 
分 析 过 程 中 没有 设置 外 类 群 。 
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2.1 Solexa 测序 和 序列 拼接 
采用 Solexa 高 通 量 测序 技术 对 处 于 跳跃 活动 已 
期 的 黄 曲 条 跳 甲 成 虫 的 转录 组 进行 测序 , 测序 共 获 
得 13 176 562 个 序列 读 取 片段 , 每 一 个 序列 读 取 厂 
段 的 长 度 为 90 bp， 即 该 次 测序 总 的 cDNA 碱 基 读 
量 约 为 1 185 Mb, 3& Hj SOAPdenovo 软件 聚 类 拼 
接 , 设置 参数 kmer = 24, 最 终 得 有 效 的 contig H 
1 702 083 条 , 序列 分 析 过 程 相 关 的 统计 数据 见 表 
1。 对 于 拼接 序列 的 长 度 分 布 特征 ,鉴于 只 有 24 bp 
的 序列 片段 太 多 ,本 文中 只 统计 三 50 bp 的 contig 
的 长 度 分 布 特征 , 具体 结果 见 表 2。 
表 1 Solexa 高 通 量 测序 的 序列 拼接 分 析 
Table 1 Sequence assembly after Illumina’ s 


Solexa sequencing 


读 取 序 列 的 拼接 分 析 数量 
Reads assembled Counting 
n x P 
BUT ELI 13 176 562 
Total number of reads 
HEBU BERMASA Cnt 
读 取 搬 段 的 碱 基数 量 总 和 (mt) 1 185 890 580 
Total nucleotide length of reads 
REIR 1 702 083 
Total number of contigs 
重合 群 平均 长 度 (nt) 43 
Mean contig length 
RAKE AM Cnt 
REB Cnt) 72 508 369 
Total contig length 
序列 骨架 数量 总 
子 列 骨 染 数量 总 和 50 332 
Total number of scaffolds 
序列 骨架 平均 长 度 (nt) 302 
Mean scaffold length 
| E < E A t 
序列 骨架 长 度 总 和 (nt) 15 185 104 


Total scaffold length 


2.2. 序列 比 对 分 析 、 注 释 及 unigene 的 特征 分 析 
对 于 长 度 宇 500 bp 的 4 924 条 contig, 结合 现 
国际 上 已 公布 全 基因 组 序列 的 5 种 模式 昆虫 的 基因 
组 数据 库 , 进行 blastx 比 对 分 析 , 见 表 3。 
首先 对 比 对 分 析 中 E value x 1e-100 的 保守 基 
因数 量 进行 了 分 析 。 表 3 Won, 黄 曲 条 跳 甲 与 同 为 
薄 翅 目的 赤 拟 谷 盗 之 间 的 保守 基因 数量 最 多 ,， 达 
788 fh, 占 总 数 的 16.0% 。 另 外 , 与 表 3 中 5 种 昆 
虫 之 间 都 保守 的 基因 数量 也 有 120 种 ,， 占 总 数 的 
2.4% 。 本 研究 以 高 保守 (上 value =0) KERERE 
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R2 contig 的 长 度 分 布 特征 分 析 
Table 2 Length distribution of contigs 


Contigz 50 bp 


zE M JE: AN 
EAR UAA) 245 572 
Total number of contigs 
重合 群 平均 长 度 (nt) 121 
Mean contig length 
重合 群 长 度 总 和 (nt 
RUFI CO) 29 823 382 


Total contig length 


Contigz: 100 bp 


Contig z200 bp Contig =500 bp 


60 239 25 480 4 924 
243 310 730 
14 629 041 9 735 642 3 595 484 


RI 4924 条 contig 5 5 种 模式 昆虫 基因 组 数据 的 比 对 分 析 


Table 3 Alignment analysis of 4 924 contigs with sequences in genome database of 5 model insects 


blastx 比 对 分 析 同 源 基因 数量 


同 源 基 因数 量 非 同 源 基 因数 量 


Total number of homologous genes Total number of homologous genes Total number of non-homologous genes 


Sequence alignment using blastx 


(E value 1e-100) 


与 家 和 蛋 基 因 组 信息 比 对 分 析 


164 
Hit to Bombyx mori 
与 黑 腹 果 蝇 基因 组 信息 比 对 分 析 345 
Hit to Drosophila melanogaster 
与 冈比亚 按 蚊 基因 组 信息 比 对 分 析 475 
Hit to Anopheles gambiae 
与 西方 蜜蜂 基因 组 信息 比 对 分 析 126 
Hit to Apis mellifera 
与 赤 拟 谷 盗 基因 组 信息 比 对 分 析 788 
Hit to Tribolium castaneum 
与 非 元 余 和 恒 日 数据 库 比 对 分 析 . 
120 (120*) 


Hit to non-redundant protein database 


(E valuex 1e-5) ( E value > 1e-5) 


3 408 1 516 
3 699 (2 209 ** ) 1 225 06 
631 +275 
(631 +275) — cM 
3 709 1215 (610 +21) 
610 
3 827 1 097 
1 066 
3 858 1 066 
(631 +435) 
4 314 610 610 610 


* 与 上 述 5 种 昆虫 比 对 分 析 的 了 value 都 小 于 或 等 于 1e-100 的 unigene 总 数 Total number of contig hits to above five insects with E values 1e-100. 
= 与 黑 腹 果 蝇 基因 直系 同 源 的 unigene 的 数量 Total number of contig orthlogs to genes of D. melanogaster. 


Ed Cinnexin2) 基因 为 代表 , 对 6 种 昆虫 的 innexin2 
百 系 同 源 基因 进行 了 系统 进化 分 析 ( 图 1)。 图 1 显 
7h, innexin2 的 系统 发 生 树 与 上 述 各 种 昆虫 的 进化 
地 位 基本 相符 。 图 中 黄 曲 条 跳 甲 的 innexin2 与 赤 拟 
谷 次 的 innexin2 Hy — x; Í[H EfxH H Eb m Hy 
innexin2 Ej) 8H H P E R innexin2. 的 进化 距离 比 
X8 H Eb Hi BUB RIEP innexin2 之 间 的 进化 距离 
更 小 , 这 可 能 与 innexin2 在 不 同 昆虫 种 类 中 的 进化 
速率 不 同 有 关系 。 

再 对 比 对 分 析 中 E value x 1e-5 的 同 源 基 因数 
量 进行 了 分 析 。 表 3 显示 , 黄 曲 条 跳 甲 与 鳞 翅 目 屁 
虫 蜜蜂 的 同 源 基 因数 量 最 少 , 而 与 赤 拟 谷 盗 的 同 源 
基因 的 数量 最 多 , 基本 反映 了 黄 曲 条 跳 甲 与 5 种 昆 
虫 亲缘 关系 的 远近 。 其 中 , 在 上 述 4 924 条 contig 
中 , 有 906 条 contig 未 发 现 与 家 看、 黑 腹 果 蝇 、 办 
比 亚 按 蚊 及 蜜蜂 的 基因 同 源 , 但 其 中 有 275 条 可 与 


赤 拟 谷 次 的 基因 同 源 ， 推测 该 275 条 contig 可 能 是 
HAERA RÆK. M, 结合 与 nr 数据 库 的 比 
对 分 析 结 果 , 推测 有 610 条 contig 可 能 是 黄 曲 条 跳 
甲 特有 的 基因 。 由 于 缺乏 功能 注释 参考 , 该 610 种 
黄 曲 条 跳 甲 种 特异 性 基因 的 功能 还 有 待 进一步 解析 。 

进一步 有 针对 性 地 结合 黑 腹 果 蝇 的 序列 数据 库 
和 contig 序列 进行 相互 性 的 blastx 比 对 分 析 ， 筛选 
得 分 最 高 的 匹配 对 , 进而 获取 与 黑 腹 果 蝇 重 昌 基因 
直系 同 源 的 unigene。 最 终 获 得 了 2 209 条 contig 或 
2 209 种 unigene( € 3) , 促进 了 该 批 次 序列 的 后 续 
注释 及 功能 分 析 的 高 可 信和 度 。 
2.3 与 黑 腹 果 蝇 具 直 系 同 源 的 2 209 种 unigene 的 
特征 分 析 

统计 结果 表明 , 该 批 次 的 2 209 种 unigene 涉及 
的 转录 组 序列 读 取 总 长 度 为 1.78 Mbp, 平均 序列 长 
度 为 804 bp, 其 中 和 1 000 bp 的 unigene 占 主要 部 
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4]. 达 79.7% , 1 001 ~1 500 bp 大 小 区 间 的 unigene 
占 18.2% , 而 >1500 bp 的 unigene 只 占 2.1%。 随 
机 测序 所 获得 的 同一 基因 的 EST 的 数目 可 以 在 一 
定 程度 上 代表 该 基因 在 该 组 织 中 的 表达 丰 度 。 统 计 
分 析 上 述 每 一 个 unigene 包含 的 序列 读 取 片 段 的 数 
量 总 和 分 布 趋势 发 现 , 所 含 序列 读 取 片 段 数量 分 布 
在 11 ~50 次 区 间 的 unigene 最 多 , 占 总 数 的 68.5% 
(图 2: A)。 全 序列 读 取 片段 的 数量 超过 150 次 的 
unigene 只 有 5 个 (0.2% )，, 分别 是 与 黑 腹 果 蝇 相应 
基因 同 源 的 含 WD 功能 域 基因 家 族 成 员 (1 280 bp), 
脱硫 醚 B 合成 酶 基因 (567 bp). lodestar 基因 (711 
bp). KOZ) ERE AGBS (uridine phosphorylase ) 基因 
(1035 bp). 2$ 5E X, — As ^E £ W SS ( isoprenoid 
biosynthesis enzyme) 基因 (1 350 bp ) 。 但 是 , 由 于 每 
一 个 unigene 拼接 后 的 长 度 不 同 , 因此 , 并 不 能 完全 
由 其 所 包含 序列 读 取 片 段 的 数量 精确 推 岂 unigene 的 
表达 趋势 。 本 文采 用 了 两 种 方法 进行 进一步 的 估计 。 

第 一 种 方法 是 通过 均一 化 计算 模型 分 析 
unigene 的 相对 表达 丰 度 。 计 算 公 式 为 : 相对 表达 
FE = 拼接 涉及 的 所 有 序列 读 取 片段 的 数量 总 和 x 
Solexa 测序 仪 读 取 片段 的 长 度 参数 即 90 bp/ 拼 接 后 
unigene 的 长 度 。 对 2 209 种 unigene 的 整体 分 析 结 
RER, 表达 丰 度 在 2.0 ~4.9 之 间 的 unigene 占 大 
多 数 , 接近 60% (图 2: B)。 和 表达 丰 度 超过 20 的 
unigene 只 有 6 个 (0.3% ) ,其 序列 长 度 范围 为 5324 ~ 
600 bp， 分 别 与 黑 腹 果 蝇 的 功能 未 知 量 白 基 因 
( hypothetical protein) ~ adiponectin receptor, dribble, 
线粒体 核糖 体 大 亚 基 蛋白 (39S ribosomal protein L3, 
肌 浆 / 内 质 网 型 钙 离 子 
ATP HE 3H 38 Æ H ( calcium-transporting ATPase 


mitochondrial ) 、 


Read 数 量 /contig 
Read counting 
per contig 


1-9 

E 10-49 
C] 50-99 
C] 100-149 


BB 150-199 
68.596 








IH H 


m Diptera 









膜 翅 目 
Hymenoptera 


HA H 


Coleoptera 


Diptera 


图 1 多 种 昆虫 中 innexin2(inx2 ) 基 因 的 系统 发 生 树 分 析 
Fig. 1 Phylogenetic relationship of innexin2 (inx2) in 
different insects 
使 用 PHYLIP 软件 中 的 最 大 简约 性 法 ( DNAPARS ) 构建 系统 发 生 树 。 
图 中 的 比例 尺 (0.1) 表 示 10% 的 差异 。Phylogenetic tree generated by 
method of Maximum Parsimony ( DNAPARS) in PHILIP. The scale bar 
(0.1) indicates a 1096 difference. 所 分 析 种 类 的 inx2 相关 序列 的 来 
源 及 GenBank 登录 号 GenBank accession numbers related to the species 
analyzed; Ps inx2; 黄 曲 条 跳 甲 Phyllotrata striolata; Tc: JR MA K 
Tribolium castaneum ( XP968805) ; Ag: X] EGET Anopheles gambiae 
(XM321635) ; Aa; 埃及 伊 蚊 Aedes aegypti ( XM001649705) ; Dm; 黑 
Rie Drosophila melanogaster ( NM132147) ; Dw; R iE yr ZAR D. 
willistoni ( XM002071107 ); Dv; JR W Xr Z&k fh D. virilis 
(XM002057877) ; Am; 西方 蜜蜂 Aphis mellifera ( XM003251623 ) ; 
Bt; BÉ! Bombus terrestris ( XM003397631) ; Nv: 丽 蝇 师 集 金 小 蜂 
Nasonia vitripennis ( XM001603984 ); Bm; 家 看 Bombyx mori 
( NM001043738 ); Sf; X Hh A W R Spodoptera frugiperda 

(AY196138) ; Hv; HIFR X Heliothis virescens ( AY633755). 


sarcoplasmic/endoplasmic reticulum type). Edit B 
合 酶 基因 具有 同 源 性 。 上 述 统计 数据 说 明 高 丰 度 表 
达 基 因 比 较 少 , 大 多 数 呈 中 低 丰 度 表 达 。 


相对 表达 丰 度 
Relative expression 
abundance 


E 1.0-1.9 
Bl 2.0-4.9 
[C] 5.0-9.9 


C] 10.0-14.9 
Bl 15.0-19.9 
[3] 20.0-24.9 





图 2 Unigene 包含 的 序列 读 取 片段 数量 分 析 及 其 表达 丰 度 分 析 


Fig. 2 Read counting and expression level analysis of unigenes 
A: unigene 包含 序列 读 取 片段 数量 的 分 布 Distribution of reads counting of unigenes; B; unigene 相对 表达 丰 度 的 分 布 Distribution of relative 


expresssion abundance of unigenes. 
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第 二 种 方法 是 分 析 unigene 的 拼接 过 程 中 重 倒 
区 的 序列 读 取 片 段 的 数量 (图 3)。 通 过 分 析 不 同 重 
登 区 域内 序列 读 取 卢 段 的 数量 总 和 , 选择 最 高 值 。 
如 图 3(A) 中 重 登 区 涉及 序列 读 取 卢 段 总 和 最 高 数 
量 为 5。 因 为 本 文中 对 cDNA 片段 的 测序 是 两 端 测 
序 法 , 因此 unigene 的 相对 表达 丰 度 约 为 拼接 序列 


因 相 对 表达 丰 度 可 初步 计数 为 2.5。 同 理 ,， 如 图 3 
(B, C, D) 中 该 unigene 基因 相对 表达 丰 度 可 初步 
计数 分 别 为 7, 7.5 和 10.5。 与 利用 第 一 种 计算 模 
式 得 出 4 个 contig 计算 出 来 的 相对 表达 丰 度 分 别 为 
1.8, 6.5,7.0 和 8.8 的 数值 相 比 , 总 体 趋势 相对 偏 
X, 但 其 可 信和 度 更 高 。 


读 取 片段 数量 总 和 的 1/2， 即 图 3(A) 中 unigene 基 


A B 





1 100 200 300 400 





1 500 1000 


图 3 contig 中 序列 读 取 片 段 的 拼接 位 置 及 表达 量 分 析 

Fig. 3 Mapping and abundance calculation of reads in assembled contig 
结合 Vector NTI Contig Express 软件 分 析 contig 中 序列 读 取 片 段 的 拼接 位 置 及 表达 量 Mapping of reads in the corresponding assembled contig using 
software of Vector NTI Contig Express and calculating the relative abundance of unigene. A, B, C 和 DD 分别 表示 含有 10, 50, 100 和 150 对 
(SOAPdenovo 算法 ) 序 列 读 取 片段 的 contig 代表 序列 的 拼接 图 ; 4 条 contig 的 长 度 分 别 为 502, 691, 1 280 和 1 539 bp, A, B, C and D 
demonstrate the assembled contig candidates with different length (502, 691, 1 280 and 1 539 bp, respectively) covering different number of reads (10, 
50, 100 and 150, respectively). 图 中 红色 虚 竖 线 代表 该 重 徐 区 域 涉及 的 序列 读 取 片段 数量 最 多 , 可 作为 该 unigene 被 测 到 转录 本 的 数量 ; 图 中 
绿色 实 竖 线 表示 为 多 个 序列 读 取 片 段 在 同一 重 春 位 点 显示 为 不 同 的 碱 基 , 竖 线 的 长 度 代表 该 位 置 碱 基 相 异 的 程度 , 越 长 代表 碱 基 相 异 的 频次 
越 高 。 图 中 contig 所 含 序列 读 取 片 段 的 数量 与 前 期 SOAPdenovo 算法 提供 的 数量 不 完全 相同 , 如 图 1(A) 中 只 定位 到 7.5 对 序列 读 取 片 段 , 这 
是 因为 此 处 序列 读 取 片 段位 置 分 析 所 用 的 Vector NTI Contig Express 软件 与 前 期 华 大 基因 公司 测序 拼接 所 用 的 SOAPdenovo 的 算法 不 完全 相 
E, 造成 小 部 分 序列 读 取 片段 在 Vector NTI Contig Express 分 析 中 未 能 成 功 定 位 。The number on the top of red dashed line demonstrates the relative 
abundance of unigene in this sequencing research ; green lines demonstrate different nucleotide in the same assembly site from different reads. Numbers of 
reads mapped using software of Vector NTI Contig Express in these four figures are different from the statistics numbers by method of SOAPdenovo, due to 
a different algorithm design between these two models. 


2.4 与 黑 腹 果 蝇 具 直系 同 源 的 2 209 种 unigene 的 ^ unigene 中 , 被 赋予 功能 的 基因 累计 达到 1 516 条 ， 


功能 注释 分 析 

结合 GO 数据 库 对 黄 曲 条 跳 甲 的 2 209 种 
unigene 进行 功能 注释 分 类 分 析 , 共有 2 099 种 
unigene 获得 了 功能 分 类 。GO 数据 库 又 可 分 为 3 个 
亚 类 ， 即 基因 所 涉及 的 分 子 功 能 (molecular 
function) 、 生 物 学 过 程 (biological process ) 和 细胞 组 
分 (cellular component) 。 本 文 首 先 按 unigene 可 能 
参与 的 分 子 功能 进行 分 类 分 析 ， 发 现在 2 209 种 


其 分 子 功 能 类 别 共 涉及 128 种 。 以 分 子 功 能 分 类 中 
的 一 级 子 目 录 所 涉及 的 unigene 数量 进行 统计 分 析 
ÆW, WHK unigene 以 具 结 合 能 力 (binding 
capability, GO: 0005488 ) 和 具有 酶 活性 (catalytic 
activity, GO: 0003824) 为 主 。 由 于 同一 种 基因 可 能 
具有 多 个 功能 域 或 多 种 活性 (一 因 多 效 ), 因此 本 研 
究 进 一 步 以 分 子 功 能 分 类 中 的 二 级 子 目 录 进 行 统计 
分 析 ( 图 4)。 结 果 显 示 ， 具 有 核 苷 酸 结合 能 力 


1 期 


( GO; 0000166) 的 unigene 的 累计 数量 最 多 , 具有 
离子 结合 能 力 (GO: 0043167 ) 和 具有 水 解 酶 活性 


涉及 的 unigene 数量 
Total number of unigenes 


GO:0016491 
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GO:0022892 | 
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(GO: 0016787) 的 unigene 的 累计 数量 也 比较 多 ， 
分 别 居 第 2 位 和 第 3 位 。 
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unigene 的 注释 名 录 (分 子 功能 的 二 级 目录 ) 
GO terms (second catalogue in molecular function) of unigenes 
图 4  unigene 可 能 参与 分 子 功 能 的 聚 类 统计 分 析 

Fig. 4 Statistical analysis of molecular function of unigenes 
GO; 0000989 转录 因子 结合 转录 因子 活性 Transcription factor binding transcription factor activity; GO; 0008641 小 分 子 和 蛋白 激活 酶 活性 Small 
protein activating enzyme activity; GO; 0016491 氧化 还 原 酶 活性 Oxidoreductase activity; GO; 0016740 转移 酶 活性 Transferase activity; GO: 
0016787 水 解 酶 活性 Lydrolase activity; GO; 0016874 连接 酶 活性 Ligase activity; GO; 0022857 跨 膜 转运 活性 Transmembrane transporter activity ; 
GO: 0022892 底 物 特 特异 性 转运 活性 Substrate-specifie transporter activity; GO; 0042910 异 源 物 转 运 活 性 Xenobiotie transporter activity; GO: 
0051184 辅助 因子 转运 活性 Cofactor transporter activity; GO; 0000166 核 苷 酸 结合 能 力 Nucleotide binding capability; GO; 0003676 核酸 结合 能 力 
Nucleic acid binding capability; GO; 0003682 染色 质 结合 能 力 Chromatin binding capability; GO: 0005515 蛋白 结合 能 力 Protein binding capability ; 
GO: 0008289 脂 类 分 子 结合 能 力 Lipid binding capability; GO; 0019842 维生素 结合 能 力 Vitamin binding capability; GO: 0043021 核 蛋白 结合 能 
JJ Ribonucleoprotein binding capability; GO; 0043167 离子 结合 能 力 Ion binding capability; GO: 0048037 辅助 因子 结合 能 力 Cofactor binding 
capability; GO; 0019207 激酶 调控 活性 Kinase regulator activity; GO: 0019208 BEM MEJA Jm E Phosphatase regulator activity; GO: 0060589 fi 


三 磷酸 酯 酶 调控 活性 Nucleoside-triphosphatase regulator activity. 


本 人 研究 还 对 2 209 种 unigene 所 涉及 的 生物 学 
过 程 (biological process ) 和 细胞 组 分 (cellular 
component) 进行 了 统计 分 析 。 绪 条 表明 ,有 1 393 
种 unigene 涉及 471 种 注释 名 录 。 表 4 显示 了 所 涉 
及 unigene 在 数量 上 排 前 10 位 的 注释 名 录 , 主要 有 
基因 转录 调控 、 代谢、 分 子 转运 和 上 肉 配 子 发 生 等 生 
物 学 过 程 。 为 外 ， 有 944 种 unigene 涉及 了 121 种 
细胞 组 分 的 合成 和 构建 。 上 述 3 种 功能 分 类 结果 显 
示 了 黄 曲 条 跳 甲 成 虫 跳跃 盛 期 的 基因 表达 谱 的 总 体 
情况 。 

2.5 生殖 发 育 的 相关 基因 分 析 

表 4 中 的 信息 提示 与 有 性 生殖 和 胚 子 发 生生 物 
学 过 程 相关 的 unigene 数量 较 多 。 为 了 深入 人 研究 ， 
本 文 进一步 详细 整理 了 上 述 471 种 注释 名 录 中 与 黄 
曲 条 跳 甲 生殖 行为 和 生殖 发 育 相 关 的 unigene。 表 5 
中 显示 了 部 分 unigene 可 能 参与 卵泡 细胞 迁移 、 人 性 
别 分 化 、 生 殖 腺 发 育 和 交配 行为 等 。 通 过 对 与 表 5 
中 的 “交配 行为 ”相关 的 unigene 的 序列 逐一 分 析 ， 
发 现 这 9 个 基因 分 别 是 与 黑 腹 条 蝇 或 赤 拟 谷 盗 的 快 





速 交配 基因 ( quick-to-court) , 42 5/758 H (dynamin ) 、 
多 巴 脱羧 酶 (dopa decarboxylase), 'Hf E. BZ UE 
还 蛋白 (NADPH : adrenodoxin oxidoreductase) 、 核 糖 
IKE H S7 ( ribosomal protein S7 ) 、 学 习 缺 陷 突 变 体 
(dunce), ILR R TEH E A e AR W E H (testis 
specific leucine rich repeat protein), H 5E BE Te T2 Bs 
( beta-1 ,4-mannosyltransferase egh ) 7I] 25] 38 Hoi A Bj 
( glucose dehydrogenase ) 等 基因 具有 同 源 性 。 对 于 
quick-to-court 基因 的 功能 , 国外 研究 已 表明 ,， 果 蝇 
quick-to-court 表达 量 的 提高 会 导致 雄性 对 雄性 
( male-male ) 求 个 和 一 个 迅速 发 生 的 雄性 对 上 肉 性 
(male-female ) 求爱 的 表示 (Gaines et al., 2000) , 
此 ， 上 述 功能 分 类 信息 的 分 析 及 整理 为 今后 黄 曲 条 
跳 甲 的 生殖 发 育 及 生殖 行为 调控 的 研究 提供 了 宝贵 


的 序列 信息 o 
2.6 代谢 路 径 分 析 


结合 黑 腹 果 蝇 的 KECC Pathway 数据 库 ， 对 上 
述 2 209 种 unigene 可 能 参与 或 涉及 的 代谢 路 径 进 
行 分 析 。 本 研究 发 现 共 363 种 unigene ,涉及 到 40 
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k4 biological process 分 类 中 涉及 unigene 最 多 的 前 10 种 注释 名 录 


Table 4 Terms in biological process with Top 10 highest number of related unigenes 


G0 分 类 号 


排序 
Rating 


10 


GO 注释 名 录 ( 生物 学 过 程 ) 


Terms of biological process 








Regulation of transcription 


RNA 分 子 代 谢 调 控 


Regulation of RNA metabolic process 


多 细胞 生物 的 生 将 


Multicellular organism reproduction 


有 性 生殖 


Sexual reproduction 
配子 发 生 

Camete generation 
SEHE AT SES 
Vesicle-mediated transport 
*& EET 

Protein localization 


AEE EE ASA JE 


Cytoskeleton organization 


转录 


Transcription 


和 蛋 日 水 解 


Proteolysis 


Accession no. of GO term 


GO 


GO: 


GO: 


GO: 


GO: 


GO: 


GO: 


GO: 


GO: 


GO: 


0045449 


0051252 


0032504 


0019953 


0007276 


0016192 


0008104 


0007010 


0006350 


0006508 


. NIA. E. 
unigene 数量 


unigene counting 


167 


141 


141 


140 


136 


131 


125 


122 


119 


118 


RS biological process 分 类 中 与 生殖 发 育 相 关 独 立 基 因 的 注释 名 录 


Table 5 Unigenes categorized into GO subcategories of biological process involved in reproductive biology 


排序 
Rating 


GO 注释 名 录 ( 生 物 学 过 程 ) 


Terms of biological process 








卵泡 细胞 发 育 

Ovarian follicle cell development 
卵泡 细胞 迁移 

Ovarian follicle cell migration 


性 别 分 化 


Sex differentiation 


生殖 腺 发 育 


Gonad development 


初级 性 征 发 育 


GO; 0030707 


GO: 


GO: 


GO: 


GO: 


Development of primary sexual characteristics 


交配 行为 
Mating behavior 


种 代谢 路 径 。 含 相关 unigene 数量 较 多 的 代谢 路 径 


主要 有 : 


iz A fV BS f$ ( ubiquitin mediated 


proteolysis). A Mkt tRNA 合成 路 径 ( aminoacyl-tRNA 
biosynthesis) ~ TTA fJ Ms VES fe (limonene and 
pinene degradation). HP Fr Es M RU D A d V 4] Pt 


GO: 


fe 中 


( transglutaminase ) 、 


unigene 


GO 分 类 号 


Accession no. of GO term 


0007297 


0007548 


0008406 


0045137 


0007617 


. NIA. E. 
unigene 数量 


unigene counting 


49 


22 


12 


10 


10 


55 


主要 有 : RAAM ik ES 
A dn ERR BL E Tr Te EN 


( lysophospholipid acyltransferases) , R INF JM d e 
HS ( trans-prenyltransferase ) . -y- A P tr T9 BS 
(gamma glutamyl transpeptidase ) , 4 $E fi A BS 


1 期 WERT: 基于 Solexa 高 通 量 测序 的 黄 曲 条 跳 甲 转录 组 学 研究 9 


( short-chain dehydrogenase ) 和 触角 特异 性 细胞 色素 
P450 ( antennae-rich cytochrome P450) 等 ， 上 述 6 种 
unigene 都 可 在 nr 数据 库 中 找到 已 注释 的 同 源 基 
。 昆 虫 的 标 檬 炮 和 菠 烯 代谢 路 径 涉及 对 植物 次 生 
代谢 物 的 趋 性 或 防御 体系 。 因 此 ， 上述 unigene 的 
发 现 对 于 阐明 黄 曲 条 跳 甲 对 植物 次 生 代 谢 分 子 或 挥 
发 性 气味 分 子 的 识别 和 信息 反馈 机 理 研究 具有 非常 
重要 的 意义 。 





本 人 研究 还 成 功 鉴 定 到 与 生物 钟 代谢 路 径 相 关 的 
5 种 生物 钟 基因 : Ps clk, Ps cyc, Ps tim, Ps per 和 
Ps vi 基因 。 参 考 黑 腹 果 蝇 的 生物 钟 代谢 路 径 分 析 ， 
初步 推 新 5 个 基因 在 生物 钟 代谢 路 径 中 可 能 的 位 置 
见 图 5 中 的 星 号 标记 , 真实 的 路 径 逻 辑 关 系 还 需 进 
一 步 的 实验 验证 。 上 述 核心 生物 钟 基因 的 鉴定 , 对 
于 深入 研究 黄 曲 条 跳 甲 昼夜 节律 行为 及 相关 行为 的 
分 子 、 细 胞 和 进化 的 基础 提供 了 宝贵 的 数据 信息 。 


^ -- 
; 
| 1 Ps vri 
l =m (DNA) 
降解 | XPps Per 
[o] To 
Degradation 
*p 


| -------- 





| 


| | 
—— > 站 


降解 
«——— | Ps Tim 


| 


| 
[el^ UA 


| 
P 


Ps cyc 


-一 一 ovw 
* 


Degradation | Ps_Tim 
I mum (DNA) 
| Ps_Pdp 
| l 
I v v 
细胞 浆 、， UM. | 磷酸 化 +p 迁移 一 诱导 一 抑制 一 | | 
« Nucleus | . . . pu: i 
Cytoplasm * | Phosphorylation Deliver Induction Inhibition , 


图 5 鉴定 的 5 个 生物 钟 基因 在 生物 钟 路 径 模 型 中 可 能 的 位 置 
Fig. 5 Five core biological clock genes showed in circadian rhythm model 
^E yh Ets E pg SUE Ro RJ E PTS (KEGG database, Circadian rhythm-Fly, Kanehisa Laboratories) ; Dbt 为 黑 腹 果 蝇 double-time( dbt) 基因 的 和 蛋 
E1779; Sgg 是 黑 腹 果 蝇 glycogen synthase kinase 基因 的 蛋白 产物 ; Pdp 是 黑 腹 果 晶 hepatic leukemia factor 基因 的 蛋白 产物 。 这 3 个 基因 的 同 源 
基因 尚未 在 黄 曲 条 跳 甲 转录 组 测序 中 被 鉴定 到 。Circadian rhythm model of Phyllotrata striolata refers to the circadian rhythm of Drosophila 
melanogaster ( dme04711, KEGG database) ; Dbt is the protein product of double-time ( dbt) of D. melanogaster; Sgg is the protein product of glycogen 


synthase kinase of D. melanogaster; Pdp is the protein product of hepatic leukemia factor of D. melanogaster. Gene of P. striolata orthology to above 


three genes was not identified in currently sequencing research. 


3 讨论 


本 人 研究 首次 在 国内 外 采用 高 通 量 测序 技术 对 黄 
曲 条 跳 甲 成 虫 的 转录 组 进行 测序 和 功能 分 析 , 并重 
点 挫 掘 与 其 行为 及 生殖 发 育 相 关 的 基因 。 本 研究 共 
获得 2 209 种 具 较 高 注释 可 信和 度 的 unigene， 表 明 在 
对 黄 曲 条 跳 甲 基因 组 及 遗传 背景 几乎 不 清楚 的 情况 
下 , 高 通 量 测序 技术 是 批量 发 现 黄 曲 条 跳 甲 功能 基 
的 有 效 手 段 。 与 传统 测序 相 比 ，Solexa 高 通 量 测 
序 的 长 度 完 全 可 以 满足 序列 数据 分 析 的 要 求 , H 
Solexa 测序 还 具有 速度 快 、 通 量 高 、 成 本 低 的 优点 。 


本 人 研究 目前 只 优先 分 析 了 长 度 三 500 bp 的 
2 209 种 unigene。 然 而 ,本 次 转录 组 测序 数据 中 还 
有 20 556 条 contig,， 其 长 度 范围 在 200 ~ 500 bp 之 
间 。 按 同样 分 析 方 法 进行 初步 筛选 后 ， 可 获得 
uingene 为 4 451 种 。 该 批 次 的 4 451 种 unigene 的 
序列 与 上 述 的 2 209 种 unigene 的 序列 之 间 没 有 重 
ERR, 但 可 能 存在 为 同一 种 全 长 cDNA 序列 上 的 
两 个 或 多 个 尚未 相连 拼接 的 序列 区 段 。 因 此 , 本 次 
转录 组 分 析 可 获得 的 长 度 三 200 bp 的 unigene 种 类 
数量 会 超过 2 209 种 , 数量 介 于 2 209 ~6 660 之 间 。 
由 于 黄 曲 条 跳 甲 基因 组 水 平 研究 的 清 后 ,其 基因 组 
长 度 及 基因 数量 都 还 未 知 。 与 黄 曲 条 跳 甲 同属 鞘翅 
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目的 赤 拟 谷 盗 在 2008 年 已 成 为 第 一 种 被 基因 组 测 
序 的 农业 害虫 , 基因 组 长 度 大 约 200 Mbp, 具有 基 
因 ( 或 蛋 日 ) 数量 大 约 有 16 000 个 (Tribolium 
Genome Sequencing Consortium, 2008) 。 如 果 初 步 参 
考 赤 拟 谷 盗 的 基因 数量 , 将 黄 曲 条 跳 甲 的 基因 数量 
假定 为 16 000 个 , 则 本 次 转录 组 测序 分 析 获 得 
unigene( =200 bp) 的 数量 可 能 占 黄 曲 条 跳 甲 总 基 
因数 目的 13.8% ~41.6% , 为 后 期 在 基因 组 水 平 研 
究 黄 曲 条 跳 甲 提供 了 丰富 的 基因 信息 。 

昆虫 的 行为 节律 是 一 种 由 生物 钟 控制 的 内 源 性 
市 律 。 昆 虫 的 交尾 节律 受 内 源 性 生物 钟 控 制 的 现象 
已 在 部 分 昆虫 中 得 到 证 实 。 国 内 学 者 对 大 猿 叶 忠 卵 
孵化 的 时 辰 节律 人 赋 究 发 现 , MHE EXE IE TERR 
明和 黄 民 ， 且 以 黎明 时 孵化 率 最 高 (徐强 和 张 庆 ， 
2007) 。2009 Œ, 美国 研究 人 员 发 现 , 东 蝇 的 生物 
钟 可 以 使 它们 在 一 天 的 某 一 时 段 ， 而 非 其 他 时 段 ， 
对 杀 虫 剂 敏感 得 多 。 即 在 一 天 的 时 间 里 , 与 果 蝇 抵 
御 能 力 最 弱 时 段 相 比 , 在 它 最 强 时 , 要 用 3 倍 的 杀 
虫 剂 剂量 才 会 与 前 者 有 相同 的 致死 效 采 (Hooven et 
al., 2009) 。 对 于 本 人 研究 检测 的 重要 朗 玉 害虫 一 一 
黄 曲 条 跳 甲 ,其 成 虫 的 产 卵 习性 以 上 晴天 为 多 , 一 天 
中 以 午后 为 多 (与 其 午后 活动 盛 期 的 时 间 区 域 基 本 
相符 ) ,也 表现 出 一 定 的 节律 。 本 研究 通过 同 源 性 
搜索 , 获得 了 核心 生物 钟 基因 5 个 , 同时 也 获得 了 
与 黄 曲 条 跳 甲 生殖 发 育 及 生殖 行为 相关 unigene 4 
100 多 种 。 因 此 , 诸如 关键 基因 的 鉴定 及 其 功能 人 研 
究 将 有 助 于 从 行为 调控 的 角度 创新 发 展 害 忠 的 防治 
TREE o 

本 人 研究 结合 果 蝇 的 KEGG Pathway 数据 库 分 析 
发 现 共 363 种 unigene 涉及 40 种 代谢 路 径 。 涉 及 
unigene 数量 相当 较 多 的 代谢 路 径 主 要 有 : ZRA 
谢 路 径 (ubiquitin mediated proteolysis). J tRNA 
合成 路 径 (aminoacyl-tRNA biosynthesis ) , T1 Es f fH 
JEN ES S(limonene and pinene degradation ) 等 。 
HARE MIRAR ER 1e ERE VP e E OG IK 
生 代 谢 物 的 趋 性 或 防御 体系 。2010 4E, 德国 、 台 湾 
及 瑞士 科学 家 合作 成 功 发 现 黄 曲 条 跳 甲 雄 虫 可 以 分 
泌 一 种 聚集 信息 素 | ( + )-(6R,7S) -himachala-9 ,11- 
diene ] ,而且 这 种 性 外 激素 可 以 通过 a- 雪 松 烯 | a- 
himachalene (1R,7S) ] 为 前 体 进行 化 学 合成 (Beran 
et al., 2010)。 美 国学 者 Bartelt 等 (2011 ) 又 报道 了 
黄 曲 条 跳 甲 雄 成 虫 特 有 的 倍 半 蓄 类 的 性 外 激素 。 本 
研究 中 柠檬 烯 和 比 烯 代谢 路 径 及 其 他 代谢 路 径 关 键 
基因 的 鉴定 , 对 于 阐明 黄 曲 条 跳 甲 对 外 源 或 内 源 性 


言 乱 素 的 代谢 和 信息 反馈 的 研究 具有 非常 重要 的 

因此 , 黄 曲 条 跳 甲 转录 组 学 的 研究 , 对 于 黄 曲 
条 跳 甲 的 行为 、 代 谢 路 径 及 生殖 发 育 相关 关键 酶 基 
因 的 发 掘 为 克隆 基因 、 研 究 基 因 功 能 提供 了 基础 数 
据 , 为 黄 曲 条 跳 甲 行为 调控 的 研究 葛 定 了 基础 ， 同 
时 为 应 用 生物 技术 方法 研发 防治 新 策略 提供 了 可 
行 性 。 


致谢 ”本 研究 转录 组 测序 工作 及 部 分 数据 分 析 得 到 
广州 远 平生 物 科技 公司 的 大 力 支持 。 
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